Read the general dataset and make some specific modifications and adjustments for some years
pd.options.display.max_colwidth = 150
df_funnel
| nstep | step | applicants | funnel | description | |
|---|---|---|---|---|---|
| 5 | 1 | validation1 | 1001 | 28157 | The applicant needs to confirm that she is older than 18 and younger than 35 |
| 9 | 2 | validation2 | 481 | 27156 | The applicant confirms that she is a student in one of the categories accepted by Estudar |
| 1 | 3 | user_details | 4591 | 26675 | The applicant enters information about name, email, phone number, identification number, region, gender, birth date |
| 2 | 4 | payment | 4011 | 22084 | The user needs to pay a fee to participate in the process or ask for exception |
| 10 | 5 | educations | 298 | 18073 | The applicant enters information about all the schools he has studied. The user can enter as many as for educational experience and they can be at... |
| 11 | 6 | positions | 216 | 17775 | Information about professional employment that the student had. She can enter as many as 4 different experiences |
| 7 | 7 | star | 766 | 17559 | Applicant answers a set of experiences using a framework of Situation, Task, Action, Result. The applicant can enter as many as 4 experiences |
| 4 | 10 | surveys | 1058 | 16793 | The applicant participates in a series of test that will map different characteristics, such as mindset, values, interests, and logic level |
| 3 | 11 | video | 1194 | 15735 | Applicant submits a video with at most 2 minutes explaining why he deserves to be accepted in the process and how he believes he can impact Brazil |
| 18 | 12 | confirmation | 5 | 14541 | Users confirms that all information is correct and wants to go to the next step |
| 0 | 13 | profile_incomplete | 12438 | 14536 | The user has gone through the confirmation step, however, he has not completed all the steps |
| 13 | 14 | cancelled | 153 | 2098 | User had canceled the application process |
| 17 | 15 | profile_complete | 10 | 1945 | The applicant has finished all information however she was not evaluated in the next step |
| 19 | 22 | docs_filled | 1 | 1935 | Applicant has the complete profile, has sent additional documents but he was not evaluated in the next step |
| 6 | 34 | profile_finished | 906 | 1934 | User has completed all information but the video was not selected to be evaluated |
| 8 | 35 | video_eval | 732 | 1028 | The video of the applicant is evaluated |
| 12 | 36 | interview_eval | 189 | 296 | User was approved in the video phase and evaluated in the interview step |
| 14 | 37 | panel_eval | 61 | 107 | User was approved in the interview phase and evaluated in the panel step |
| 15 | 38 | comitee_eval | 28 | 46 | User was approved in the panel phase and evaluated in the commitee step |
| 16 | 39 | scholar_eval | 18 | 18 | User was approved in the commitee phase and evaluated in the scholar step |
lcolors = int(len(df_funnel)/5)
colors = ['rgb(32,155,160)', 'rgb(253,93,124)', 'rgb(28,119,139)', 'rgb(182,231,235)', 'rgb(35,154,160)']*(lcolors+1)
data,layout = get_funnel_plot(df_funnel['funnel'],df_funnel['step'],colors)
fig = go.Figure(data=data, layout=layout)
py.iplot(fig)
print(personal+demographics)
df[personal+demographics].head()
['id', 'nome', 'sobrenome', 'email', 'rg', 'cpf', 'phone', 'country_of_birth', 'country_of_residence', 'state_of_residence', 'city_of_residence', 'birth_date', 'gender']
| id | nome | sobrenome | rg | cpf | phone | country_of_birth | country_of_residence | state_of_residence | city_of_residence | birth_date | gender | ||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 4 | 787903 | MATHEUS | SOUZA | mxtheuso@gmail.com | 3.492.500-7 | 016.175.975-03 | 79998270618 | Brasil | Brasil | Sergipe | Indiaroba | 24/08/2001 | Masculino |
| 5 | 787904 | Nislaine | Rodrigues dos Santos | nis.santos44@gmail.com | 430894818 | 451.139.708-24 | 16993168183 | Brasil | Brasil | São Paulo | Sertãozinho | 27/03/1997 | Feminino |
| 6 | 787906 | Brunna | Melgar | brunnamelgar@hotmail.com | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
| 7 | 787907 | Ana Beatriz | Souza | martins_biasouza@hotmail.com | 592335161 | 488.882.088-01 | (19)993039832 | Brasil | Brasil | São Paulo | São José do Rio Pardo | 07/07/2000 | Feminino |
| 8 | 787908 | Vitor | Falcão | vitormenezes98@hotmail.com | 1542354587 | 061.617.335-01 | 71992423172 | Brasil | Brasil | Bahia | Salvador | 19/07/1998 | Masculino |
print("'degree_0',\
'country_0', 'state_0', 'city_0', 'institution_0', 'course_0', 'start_month_0', 'start_year_0', 'end_month_0', 'end_year_0', 'grants_and_awards_0',")
df[education].dropna().head()
'degree_0', 'country_0', 'state_0', 'city_0', 'institution_0', 'course_0', 'start_month_0', 'start_year_0', 'end_month_0', 'end_year_0', 'grants_and_awards_0',
| degree_0 | country_0 | state_0 | city_0 | institution_0 | course_0 | start_month_0 | start_year_0 | end_month_0 | end_year_0 | ... | country_4 | state_4 | city_4 | institution_4 | course_4 | start_month_4 | start_year_4 | end_month_4 | end_year_4 | grants_and_awards_4 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 249 | superior | Brasil | Minas Gerais | Uberlândia | UNIVERSIDADE FEDERAL DE UBERLÂNDIA (UFU) | ARTES VISUAIS | 3.0 | 2015.0 | 12.0 | 2019.0 | ... | Brasil | Minas Gerais | Passos | Escola Estadual Nossa Senhora da Penha | Ensino fundamental | 2.0 | 2006.0 | 12.0 | 2009.0 | Aluno no A na 8ª série (atual 9º ano) |
| 268 | superior | Brasil | São Paulo | Santos | CENTRO UNIVERSITÁRIO LUSÍADA (UNILUS) | MEDICINA | 2.0 | 2018.0 | 12.0 | 2023.0 | ... | Estados Unidos | Outro | Outro | Mattawan High School | Intercâmbio Cultural | 9.0 | 2014.0 | 5.0 | 2015.0 | Ranking 52 de 252;\r\nMelhor Equipe em Model United Nations GLIMUN 2014;\r\nBaixo no Coral Sênior da escola;\r\n2 viagens para estudar canto em un... |
| 353 | superior | Alemanha | Outro | Outro | Freie Universitat Berlin | Economia | 10.0 | 2016.0 | 9.0 | 2019.0 | ... | Brasil | São Paulo | São Paulo | Escola Suíço-Brasileira de São Paulo | Ensino médio e IB Diploma | 2.0 | 2012.0 | 12.0 | 2015.0 | Medalha de Ouro Olimpíada Brasileira de Astronomia\r\nMedalha de Prata Olimpíada Brasileira de Astronomia\r\nMedalha de Ouro Olimpíada Interna de ... |
| 1108 | superior | Brasil | Santa Catarina | Araranguá | UNIVERSIDADE FEDERAL DE SANTA CATARINA (UFSC) | ENGENHARIA DE ENERGIA | 3.0 | 2012.0 | 3.0 | 2019.0 | ... | Estados Unidos | Outro | Outro | Wayne State University, Detroit | Engenharia Mecânica - Mobilidade Acadêmica | 8.0 | 2014.0 | 4.0 | 2015.0 | Matérias Cursadas:\r\nFundamentos de Veículos Híbridos e Elétricos\r\nCalculo Vetorial\r\nTermodinamica Aplicada\r\nOutros (Inglês) |
| 1568 | superior | Brasil | São Paulo | Santo André | FUNDAÇÃO UNIVERSIDADE FEDERAL DO ABC (UFABC) | Neurociência e Química | 5.0 | 2015.0 | 12.0 | 2020.0 | ... | Brasil | São Paulo | Mauá | Escola Estatual João Paulo II | Ensino fundamental | 1.0 | 2005.0 | 12.0 | 2008.0 | Medalha de bronze no festival de poesia na 5ª série;\r\nParticipante da 2ª etapa das Olimpíadas de Matemática na 6ª, 7ª e 8ª série.\r\n |
5 rows × 55 columns
print('position_type_0',
'other_position_type_0',
'sector_0',
'other_sector_0',
'company_name_0',
'title_0',
'country_0.1',
'state_0.1',
'city_0.1',
'summary_0',
'start_month_0.1',
'start_year_0.1',
'end_month_0.1',
'end_year_0.1',
'is_current_0',)
df[professional].head()
position_type_0 other_position_type_0 sector_0 other_sector_0 company_name_0 title_0 country_0.1 state_0.1 city_0.1 summary_0 start_month_0.1 start_year_0.1 end_month_0.1 end_year_0.1 is_current_0
| position_type_0 | other_position_type_0 | sector_0 | other_sector_0 | company_name_0 | title_0 | country_0.1 | state_0.1 | city_0.1 | summary_0 | ... | title_4 | country_4.1 | state_4.1 | city_4.1 | summary_4 | start_month_4.1 | start_year_4.1 | end_month_4.1 | end_year_4.1 | is_current_4 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 4 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | ... | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | False |
| 5 | Trabalho CLT | NaN | Indústria de base | NaN | AMSAM MANUTENÇÃO E SERVIÇOS | AUXILIAR ADMINISTRATIVO | Brasil | São Paulo | Sertãozinho | NaN | ... | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | False |
| 6 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | ... | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | False |
| 7 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | ... | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | False |
| 8 | Empresa Júnior | NaN | Empreendedorismo e Tecnologia | NaN | Cimatec Júnior | Assessor de Parcerias institucionais | Brasil | Bahia | Salvador | A Cimatec Júnior busca impactar pessoas através de muito conhecimento e experiências antecipadas do mercado de trabalho. Impactados também aos nos... | ... | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | False |
5 rows × 75 columns
print('stars-characteristic_1-1',
'stars-characteristic_2-1',
'stars-characteristic_3-1',
'stars-sphere-1',
'stars-situation-1',
'stars-task-1',
'stars-action-1',
'stars-result-1')
df[stars].dropna().head()
stars-characteristic_1-1 stars-characteristic_2-1 stars-characteristic_3-1 stars-sphere-1 stars-situation-1 stars-task-1 stars-action-1 stars-result-1
| stars-characteristic_1-1 | stars-characteristic_2-1 | stars-characteristic_3-1 | stars-sphere-1 | stars-situation-1 | stars-task-1 | stars-action-1 | stars-result-1 | stars-characteristic_1-2 | stars-characteristic_2-2 | ... | stars-action-3 | stars-result-3 | stars-characteristic_1-4 | stars-characteristic_2-4 | stars-characteristic_3-4 | stars-sphere-4 | stars-situation-4 | stars-task-4 | stars-action-4 | stars-result-4 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 22 | Alto nível de energia | Tomar a frente de um projeto | Persuasão | Pessoal | A empresa que eu trabalho (CIENA) precisava de um coordenador local voluntário para promover sua campanha de Wellness (bem-estar) como projeto pil... | O coordenador voluntário seria responsável por engajar os funcionários em campanhas de bem-estar, usando a criatividade para criar os projetos e p... | Este desafio foi superado com a criação de projetos diversos, afim de atingir vários tipos de pessoas e premiando os funcionários com o melhor eng... | Os funcionários se sentiram mais motivados a se movimentar mais, se sentiam desafiados a dar o seu melhor, não só pela premiação, mas pela hábito ... | Persistência frente a obstáculos | Ensinar outros | ... | Me engajei em projetos voluntários de maior impacto com o tempo e recursos que eu tenho. | Com estes projetos voluntariados percebi como muitas pessoas que necessitam são beneficiadas nas nossas ações. As crianças carentes e idosos ficar... | Tomar a frente de um projeto | Iniciativa | Alto nível de energia | Profissional | Premiação "Oustanding People" | Anualmente, a empresa em que eu trabalho premia os 5 melhores funcionários do ano, de acordo com a categoria "Inovação", "Liderança", "Cliente em ... | Ao longo do ano eu fui adquirindo mais responsabilidades do que o meu cargo exige e me engajei em ajudar vários departamentos a serem mais eficien... | Através do meu projeto de eficiência, eu consegui melhorar diversas atividades de vários departamentos o que como resultado final contribuiria par... |
| 46 | Empatia | Iniciativa | Comunicação em público | Profissional | Meu padrasto e minha mãe viajaram no natal e deixaram a responsabilidade da funerária comigo e outro funcionário, sendo que eles nunca tinham viaj... | Meia noite e meia do dia de natal recebi uma ligação de alguém que não era um cliente nosso em prantos por causa de um parente que tinha falecido ... | Entrei em contato com um parceiro da outra cidade para agilizar o translado do corpo para nossa cidade, negociei com a família o serviço do funera... | A satisfação da família do falecido se converteu num novo cliente para o nosso plano, como também de outras pessoas que ficaram satisfeitas em ire... | Iniciativa | Tomar a frente de um projeto | ... | Analisando os erros dos processos seletivos anteriores que nunca passavam de 50 inscritos, foi elaborada uma nova abordagem de comunicação, como t... | 73 inscrito no processo seletivo e 31 aprovados, sendo o maior processo seletivo da EletroJr até 2016. Com este resultado incrível, a motivação do... | Persistência frente a obstáculos | Pensar grande | Busca por um alto padrão | Pessoal | Eu tinha notas medianas em matérias relacionas a lingua portuguesa e um certo bloqueio mental em aprender qualquer coisa relacionada a linguagens.... | No ensino médio havia um trabalho sobre Os Sertões que valia o trimestre da disciplina de literatura, e eu estava gostando de estudar sobre os ass... | Busquei referências de resenha crítica, conversei com minhas professoras de português e história, escrevi, pedi ajuda de revisão e leitura a amigo... | Superei o pensamento de que não era possível eu aprender qualquer coisa, e até hoje na escola onde fiz o ensino médio, minha ex-professora de port... |
| 54 | Busca por um alto padrão | Geração de ideias | Capacidade de análise | Profissional | Eu era presidente da empresa Ecofio, criada no projeto ?Miniempresa? da organização Junior Achievement. Nosso produto era um suporte e organizador... | Eu precisava achar uma cola capaz de juntar a madeira e a ventosa. | Falei com especialistas em bricolagem e marcenaria e consegui achar uma cola adequada. | Terminamos o produto no tempo estipulado e retornamos 25% de lucro aos nossos investidores. | Geração de ideias | Iniciativa | ... | Dei aulas de química, física e matemática no Centro Espírita André Luíz(CEAL). | Os alunos melhoraram seu desempenho nas provas. Alguns conseguiram ingressar no ensino superior pelo vestibular. | Tomar a frente de um projeto | Planejamento e organização | Aconselhamento para pessoas | Pessoal | Eu era o capitão do time da minha escola do Torneio Internacional de Jovens Físicos. | Orientar o time e chegar à fase nacional da competição. | Busquei ajuda especializada com professores doutores da Universidade de Brasília. Compartilhei com meus companheiros de time minha experiência pré... | Fomos aprovados na fase nacional da competição e ganhamos uma menção honrosa. |
| 85 | Resolução de conflitos | Tomada de riscos | Iniciativa | Pessoal | Estava no começo segundo ano de Engenharia (2016), ainda estagiário técnico e com uma rotina apertadíssima. | Superar uma crise de ansiedade tremenda oriunda de pouco sono, uma vida desorganizada que ainda sim dava conta de seguir bem no curso e razoavelme... | Superar conflitos internos, principal emente arrogância e medo. Em meio ao caos, decidi sair do estágio (inimaginável na época), sob aviso prévio ... | Respeito mútuo, principalmente em relação aos meu superiores. Uma fase conturbadíssima, mas por optar por transparência 100%, ainda mantive relaçõ... | Empatia | Busca por um alto padrão | ... | Superar conflitos internos, principal emente arrogância e medo. Em meio ao caos, decidi sair do estágio (inimaginável na época), sob aviso prévio ... | Respeito mútuo, principalmente em relação aos meu superiores. Uma fase conturbadíssima, mas por optar por transparência 100%, ainda mantive relaçõ... | Empatia | Busca por um alto padrão | Capacidade de análise | Profissional | Era assistente de Captação de Recursos na MACVEST. Nossa diretora simplesmente largou o trabalho por 7 semanas durante estruturação para o segundo... | Manter a diretoria unida e focada nas metas essenciais a fim de não prejudicar feio a Associação como um todo. | Assumi, informalmente, a responsabilidade pela diretoria. Instruía meus colegas em como realizar atividades, motivava-os todos os dias, estudava m... | Manter a diretoria com seus principais assistentes (hoje meus colegas de Diretoria Executiva) entregando as atividades (eventos, relação com parce... |
| 120 | Capacidade de análise | Persistência frente a obstáculos | Busca de novas experiências | Profissional | Considerava mudar da engenharia para a física, mas achava que não seria uma decisão consciente se eu não tivesse uma experiência profissional de e... | A Radix ofertou vagas de estágio em engenharia de dados que me interessaram. O processo seletivo consistia em resolver 3 desafios sobre estatístic... | Estudei muito. Procurei ajuda de um professor da estatística. Pesquisei artigos sobre aprendizagem de máquina. Usei blogs e fóruns que ensinavam a... | A minha solução das questões desafio foi classificada em primeiro lugar. Passei no processo seletivo. Era a estagiária mais jovem da Radix e, além... | Ensinar outros | Empatia | ... | Procurei contatos de pessoas que estudavam nas universidades. Procurei nos sites das universidades seus valores e orientações sobre como as cartas... | Fui aprovada em King's College London e University of Bristol, ambas estão dentro das 10 melhores universidades do Reino Unido e das 50 melhores d... | Visão de vários cenários | Persuasão | Tomada de riscos | Profissional | O Equalizar estava em um contexto em que poucos membros participavam da administração do cursinho. Estávamos tentando mudar isso por meio de uma t... | Tínhamos que realizar dois processos seletivos, um de alunos e outro de membros, além de outras tarefas da diretoria de RH que já estavam atrasadas. | Insisti em debater sobre a possibilidade de abrir comissões para os processos seletivos. Metade dos membros do RH não queriam abrir comissões para... | Pessoas que não participavam dos processos participaram por meio das comissões. Conseguimos realizar processos seletivos mais complexos e com meno... |
5 rows × 32 columns
print(logic)
df[logic].dropna().head()
['logic-analogia-score', 'logic-matrizes-score', 'logic-problema-score', 'logic-sequencia-score', 'logic-score', 'logic-level', 'logic-percentile']
| logic-analogia-score | logic-matrizes-score | logic-problema-score | logic-sequencia-score | logic-score | logic-level | logic-percentile | |
|---|---|---|---|---|---|---|---|
| 8 | 60.0 | 30.0 | 10.0 | 0.0 | 25.0 | Baixo | 18.0 |
| 10 | 40.0 | 70.0 | 80.0 | 0.0 | 48.0 | Médio Alto | 65.0 |
| 15 | 70.0 | 90.0 | 70.0 | 60.0 | 73.0 | Muito Alto | 96.0 |
| 18 | 20.0 | 0.0 | 40.0 | 40.0 | 25.0 | Baixo | 18.0 |
| 21 | 50.0 | 60.0 | 60.0 | 0.0 | 43.0 | Médio | 56.0 |
print(mindset)
df[mindset].dropna().head()
['mindset-stability', 'mindset-aggressiveness', 'mindset-outcome_orientation', 'mindset-emphasis_on_reward', 'mindset-team_orientation', 'mindset-agility', 'mindset-attention_to_detail', 'mindset-informality']
| mindset-stability | mindset-aggressiveness | mindset-outcome_orientation | mindset-emphasis_on_reward | mindset-team_orientation | mindset-agility | mindset-attention_to_detail | mindset-informality | |
|---|---|---|---|---|---|---|---|---|
| 8 | 6.0 | 2.5 | 6.7 | 3.8 | 5.6 | 5.8 | 6.3 | 3.8 |
| 10 | 5.5 | 4.6 | 4.6 | 4.4 | 4.7 | 4.6 | 5.4 | 2.9 |
| 12 | 6.8 | 1.3 | 4.6 | 6.3 | 5.6 | 4.6 | 7.5 | 2.1 |
| 15 | 5.8 | 2.5 | 5.8 | 4.4 | 6.3 | 3.8 | 8.8 | 3.3 |
| 17 | 5.3 | 3.8 | 2.9 | 8.8 | 3.4 | 7.5 | 5.0 | 1.7 |
print(personality)
df[personality].dropna().head()
['personality-extroversion', 'personality-openness', 'personality-agreeableness', 'personality-conscientiousness', 'personality-emotional_stability']
| personality-extroversion | personality-openness | personality-agreeableness | personality-conscientiousness | personality-emotional_stability | |
|---|---|---|---|---|---|
| 8 | 4.0 | 2.3 | 0.5 | 2.3 | 0.0 |
| 10 | 1.3 | 3.3 | 1.8 | 1.8 | -1.5 |
| 12 | 4.0 | 4.5 | 0.5 | -0.8 | -1.3 |
| 15 | 1.8 | 3.8 | -0.3 | 2.8 | 2.0 |
| 17 | 3.0 | 3.8 | -1.5 | 2.5 | -4.5 |
print(interest)
df[interest].dropna().head()
['interest-top', 'interest-result_label_1', 'interest-result_level_1', 'interest-result_label_2', 'interest-result_level_2', 'interest-result_label_3', 'interest-result_level_3']
| interest-top | interest-result_label_1 | interest-result_level_1 | interest-result_label_2 | interest-result_level_2 | interest-result_label_3 | interest-result_level_3 | |
|---|---|---|---|---|---|---|---|
| 8 | IES | Investigativo | 8.0 | Empreendedor | 7.0 | Social | 6.0 |
| 10 | AES | Artístico | 6.0 | Empreendedor | 4.0 | Social | 3.0 |
| 12 | IEA | Investigativo | 8.0 | Empreendedor | 7.0 | Artístico | 6.0 |
| 15 | IAE | Investigativo | 8.0 | Artístico | 7.0 | Empreendedor | 6.0 |
| 21 | ISC | Investigativo | 9.0 | Social | 7.0 | Convencional | 7.0 |
video_file = path_pdb+str(year)+"/"+level+"/videos/artur.amorim2000@gmail.com.mp4"
video = io.open(video_file, 'r+b').read()
encoded = base64.b64encode(video)
HTML(data='''<video alt="test" width="320" height="240" controls controls>
<source src="data:video/mp4;base64,{0}" type="video/mp4" />
</video>'''.format(encoded.decode('ascii')))